iiiiiiiiiiiiiiiiiiiiiiiiiii 

0 423 050 A1 

@ DEMANDE DE BREVET EUROPEEN 

© Numero de depot: 90460037.6 0 Int. CI.S: H04B 1/66 



@ Date de depot: 12.10.90 



® 


Priorite: 13.10.89 FR 8913649 




General Leclerc 

F-92131 Issy-les-Moullneaux(FR) 


@ 


Date de publication de la demande: 








17.04.91 Bulletin 91/16 




Inventeur: Mahieux, Yannick 


@ 


Etats contractants designes: 
DE GB IT NL 




Bourg Tonquedec 
F-22140 Begard(FR) 


0 


Demandeur: ETAT FRANCAIS represente par 
le Ministre des Postes, Telecommunications 
at de I'Espace 

(CENTRE NATIONAL D'ETUDES DES 
TELECOMMUNICATIONS), 38-40 rue du 


® 


Mandataire: Corlau, Vincent 

c/o Cabinet Vidon immeuble Germanium 80 

avenue des Buttes de Coesmes 

F-35700 Rennes(FR) 



@ Dispositif d'allocation de bits pour signal audio-numerlque transforme, a quantification adaptative 
sur critere psycho-auditif. 





Europaisches Patentamt 
@ Olll European Patent Office 



_ * . . (JL) Numero de publicatioi 

Office europeen des brevets ^ 



(57) Le domaine de i'invention est celui de la compression de signaux audio numeriques. L'invention s'applique 
notamment a la transmission de signaux sonores sur canaux numeriques, ainsi qu'aux dispositifs de stockage de 
signaux sonores numeriques. 

L'invention concerne un dispositif de compression d'un signal audionumerique. en utilisant un dispositif 
d'allocation de bits disponibles pour la transmission ou le stockage du signal, pilotant des moyens de 
quantification adaptative du signal, afin de permettre une reduction importante du debit tout en conservant au 
maximum la qualite du signal de depart. 

Selon rinvention, le dispositif comprend des moyens (16) d'allocation d'un nombre de bits specifique pour 
Texpression des coefficients de chaque bande de frequence d'un signal (12) audionumerique transforme, en 
fonction d'une information auxiliaire (19) correspondant a une description du spectre dudit signal (12), ledit 
dispositif etant informe par des moyens (14) d'elimination prealable de composantes spectrales dudIt signal (12) 
transforme en fonction d'un critere psycho-auditif. 
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DISPOSITIF D'ALLOCATiON DE BITS POUR SIGNAL AUDIO-NUMERIQUE TRANSFORME, A QUANTIFICA- 
TION ADAPTATIVE SUR CRITERE PSYCHO-AUDITIF. 

Le domaine de i'invention est celui de la compression de signaux audio numeriques. L'invention 
s'applique notamment a la transmission de signaux sonores sur canaux numeriques, ainsi qu'aux dispositifs 
de stockage de signaux sonores numeriques. 

Plus precisement, l'invention concerne un dispositif deallocation de bits, permettant une quantification 
5 adaptative d'un signal audio-numerique, apres que ceiui-ci a ete transforme dans le domaine frequentiel et 
decoupe en bandes de frequence. 

L'invention peut par exemple etre mise en oeuvre dans les systemes de diffusion directe par satellite, 
tels que ceux developpes dans le projet europeen DAB (Digital Audio Broadcasting/Diffusion Audio 
Numerlque), ou encore dans des systemes de diffusion par RNIS, et de distribution haute-fidelite. Elle 
10 s'applique egaiement notamment aux dispositifs de stockage, tels que les disques numeriques. 

Les signaux audio numeriques presentent de nombreux avantages par rapport aux signaux analogiques. 
notamment en ce qui concerne la fidelite du son, la conservation de la quallte initiale et la soupiesse 
d'utiiisation. Toutefois, le debit resultant de la conversion en numerlque des signaux audio est tres 
important, en particuller pour les signaux haute quallte. dont la largeur de bande est superieure a 15 kHz. 
75 II est alors necessaire de faire appel a des techniques de reduction de debit. 

De fagon connue et largement repandue, les techniques utillsees font appel a des algorithmes de 
transformation mathematique du signal audio-numerique source. Les techniques de codage par transformee 
ont ete largement appliquees aux domaines de I'lmage, ou de la parole; elles sont depuis peu egaiement 
appliquees au traitement des signaux audio, principalement musicaux. 
20 Dans les codeurs existants mettant en oeuvre ces techniques, le signal subit d'abord une decoupe en 
blocs temporels. puis est soumis a une transformation temps/frequence. Ce sont les coefficients des blocs 
transformes qui sont codes et transmis. Au decodeur, une transformation inverse dellvre le signal decode et 
reconstruit. 

L'applicatlon de la transformation mathematique accomplit une concentration de Tenergie du signal 
25 source sur les coefficients les plus importants, et permet ainsi une reduction du debit en controlant et 
minimisant la degradation auditive, notamment par elimination selective de certains des coefficients 
transformes. En effet, le fait de travalller dans le domaine frequentiel favorise la prise en compte des 
proprietes perceptuelles et psycho-auditives qui sont principalement liees a la nature spectrale du son. La 
prise en compte de criteres psycho-auditifs repose, dans la plupart des dispositifs existants, sur ('analyse 
30 de ZWICKER ("Psychoacoustique" ; Ed. Masson 1981), fondee sur le concept de masquage des 
composantes spectrales inaudibles. 

Les dispositifs connus realises sur ces principes different entre eux sur certains partis pris de 
conception : 

- la transmission ou non d'une Information auxiiiaire a I'lnformation prlnclpale ; 

35 - rutilisation ou non de techniques remediant a Teffet des perturbations de transmission ; 

- les techniques de prise en compte des criteres psycho-auditifs pour effectuer la reduction de debit et la 
localisation de leur mise en oeuvre dans les chatnes de codage et de decodage du signal : 

r les modes de codage de compression des informations principales, et, le cas echeant, des informations 
auxiliaires transmlses. 

40 Ainsi, dans un premier dispositif connu de ce type, tel que decrit dans le document de brevet frangais 
PR 89 06194, '^Procede et installation a codage des signaux sonores", au nom des deposants, on met en 
oeuvre successivement le decoupage du signal sonore en blocs d'echantillons, la transformation temps- 
frequence et un codage predictif et adaptatif des coefficients les plus significatifs de chaque bloc, utilisant 
la stationnarite du signal. Dans ce dispositif, Tinformation auxiiiaire est transmise lors des blocs de 

45 transition, qui rendent Impossible la prise en compte d'une correlation interblocs. Dans toutes les autres 
situations, cette Information auxiiiaire sert seulement a piloter le module d'allocation de bits alimentant le 
quantificateur de signal principal. Ce dispositif permet une diminution du debit. Toutefois, II entratne une 
degradation' en chaTne de la reconstltution des blocs regus, lorsqu'une erreur se produit. du fait que cette 
erreur se repercute sur le bloc suivant; et ainsi de suite, via le rebouclage d'elaboration de rinformation 

50 auxiiiaire pllotant Tallocateur de bits et le quantificateur du decodeur. 

On connatl egaiement des dispositifs dans lesquels une information auxiiiaire est transmise pour 
chaque bloc, par codage adaptatif. Un tel dispositif est par exemple decrit dans Particle de BOCHOW 
"Multiprocessor Implementation of an ATC Audio Codec" (Implantation multiprocesseur d'un 
codeur/decodeur audio a codage adaptatif par transformation) (Actes du Congrfes ICASSP 1989; Glasgow). 
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Un inconvenient de ce dispositif est que le codage en continu de I'information auxiliaire reclame un debit 
eleve, au detriment du debit alloue a I'information principale. 

Le document de JOHNSTON, "Transform Coding of Audio Signals Using Perceptual Noise Criteria"( 
(Codage par transformation de signaux utilisant des criteres psychoacoustiques) (IEEE Journal on Selected 
5 Areas in Communication. Vol.6, n'2, Fevrier 1988; pp.314-323), presente un dispositif de reduction de 
debit par quantification adaptative comportant une mise en oeuvre des seuils de masquage selon Tanalyse 
de ZWICKER. sous forme d'un algorithme de prediction au niveau du quantificateur du signal principal. Cet 
algorithme vise a minimiser le rapport bruit/seuil de masquage. De meme que dans le dispositif de 
BOCHOW, i'information auxiliaire est transmise en continu. Ce dispositif presente d'autre part un codage a 
10 longueur variable, ou codage de HUFFMAN en sortie du quantificateur, assez complexe a mettre en oeuvre. 

L'invention a notamment pour but de pallier les inconvenients de ces differents disposttifs connus. 

Plus precisement, Tobjectif de invention est de fournir un dispositif de compression d*un signal 
audionumerique, en utilisant un dispositif d'allocation de bits disponibles pour la transmission ou le 
stockage du signal, pilotant des moyens de quantification adaptative du signal, afin de permettre une 
75 reduction importante du debit tout en conservant au maximum la qualite du signal de depart. 

L'invention a egalement pour objectif de fournir un tel dispositif d'allocation de bits dont le principe de 
fonctionnement tienne compte de criteres psychoauditifs. 

Un autre objectif de l'invention est de minimiser les phenomenes de degradation en chaTne a la 
reconstitution du signal lorsqu'une perturbation generatrice d^erreurs ou de brouillage se produit dans le 
20 canal de transmission. 

Un objectif complementaire de ^invention est de fournir, dans un des modes de realisation avantageux 
de l'invention un principe de transmission conjointe dNnformations principales et d'informations auxiliaires, 
en optimisant le debit des informations auxiliaires, puis des informations principales. 

L'invention a egalement pour objectif de permettre Tutilisation d'un nombre de bits fixe pour le codage 
25 de cfiaque bloc d'informations. 

Ces objectifs, ainsi que d*autres qui apparaltront par la suite, sont atteints a I'aide d'un dispositif 
d'allocation de bits, du type assurant le pilotage de moyens de quantification de compression d'un signal 
audionumerique transforme, destine a etre transmis a travers un canal a debit limite ou stocke sur un 
support d'informations numeriques, dans lequel Tallocation consiste notamment a affecter a chaque bande 
30 d'un jeu de bandes adjacentes couvrant la totalite du spectre du signal transforme. un nombre de bits 
specifique pour I'expression des coefficients transformes dudit signal, en fonction d'une information 
auxiliaire correspondant a la description du spectre dudit signal transforme, ledit dispositif etant informe par 
des moyens d'elimination prealable de composantes spectrales dudit signal transforme en fonctjon d'un 
critere psycho-auditif. 

35 Cette elimination de composantes spectrales pour Telaboration de I'information auxiliaire permet une 
optimisation a priori de Toperation de quantification. 

Avantageusement, ledit dispositif comporte (de fagon connue) des moyens de calcul du seuil de 
masquage de composantes spectrales sur critere psycho-auditif, pour I'optimisation de ('allocation des bits 
dans chacune desdites bandes. 

40 De faQon preferentielle. ledit critere psycho-auditif fonctionne selon le critere de masquage psycho- 
auditif de ZWICKER. 

Selon une caracteristique importante de Tinventlon, lesdits moyens de quantification comportent au 
moins deux quantificateurs distincts et des moyens d'affectation selective de I'un desdits quanttficateurs a 
chacune desdites bandes du spectre dudit signal transforme en fonction du nombre de composantes 
45 conservees dans ladite bande, apres ladite elimination des coefficients masques. 

Dans un mode de realisation preferentiel de Tinvention, ledit dispositif comprend des moyens de 
minimisation d'un rapport bruit de quantification/seuil de masquage dans chacune desdites bandes. 

De fagon avantageuse. ledit bruit de quantification est determine en fonction d'au moins une des trois 
informations appartenant au groupe comprenant: 
50 - I'ecart-lype desdites composantes spectrales non eliminees dans ladite bande ; 

- un facteur de performance dudit quantificateur selectionne pour ladite bande ; 

- une information d*etalement spectral de ladite bande. 

Selon une autre caracteristique de l'invention, ladite information fournie par lesdits moyens d'elimination 
prealable de composantes spectrales est elaboree par des moyens de codage des longueurs de suites 
55 pour le codage des indices desdites composantes spectrales masquees. 

Preferentiellement, lesdits moyens de codage des longueurs de suites utiiisent un code a longueur 
variable du type des codes de HUFFMAN. 

Selon une caracteristique avantageuse, lesdits moyens de codage des longueurs de suites delivrent un 
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mot de code specifique pour le codage des bandes de frequence dont toutes lesdites composantes sont 
eltminees, 

De fagon avantageuse. lesdits moyens de codage des longueurs de suites sont activees par des 
moyens de selection, en fonctlon d'une information de gain de debit apporte par ledit codage. 
5 Selon une autre caracteristique importante de Tinvention, ledit disposltif coopere avec des moyens de 

codage desdites informations auxiliaires correspondant a la description du spectre. 

De cette faQon, il est possible de transmettre en permanence une information auxiliaire, sans que cela 
ne nuise de fagon importante au debit de Tinformation principale. 

De fagon preferentielle, lesdits moyens de codage comprennent des moyens de codage predictif. 
10 Ainsi, les risques de degradation en chaTrie sont supprimes en ce qui concerne Tinformation principale. 
Cela ne peut se produire, dans Tinvention, que sur Tinformation auxiliaire. 

Avantageusement, lesdits moyens de codage predictif comprennent des moyens appartenant au 
groupe comprenant les moyens de conversion logarithmique, les moyens de codage MIC differentiel, et les 
moyens de codage par code a longueur variable, du type des codes de HUFFMAN. 
15 Preferentiellement, lesdits moyens de codage comprennent egalement des moyens de codage sans 
memoire interblocs. lesdits moyens de codage predictif et lesdits moyens de codage sans memoire etant 
selectlonnes selon un critere predetermine. 

Avantageusement, ce critere predetermine est un critere de moindre debit et/ou un critere de 
minimisation de Teffet des erreurs de transmission. 
20 Selon une caracteristique avantageuse de Tlnvention, au moins une des informations appartenant au 
groupe comprenant ladite information auxiliaire correspondant a la description du spectre, ladite information 
fournie par lesdits moyens d'elimination des composantes inaudibles et une information d'etalement 
spectral, est transmise ou stockee conjointement a chacun des blocs dMnformation principale, 

Selon une autre caracteristique de I'invention, ledit signal numerlque transforme est elabore par des 
25 moyens de codage par transformation utilisant une transformee du type de la transformee en cosinus 
discrete modifiee de PRINCEN et BRADLEY. 

De fagon avantageuse, lesdits moyens de codage par transformation comportent des moyens de 
fenetrage adouci du signal temporel faisant apparaitre une symetrie dans ledit signal transforme. 

Preferentiellement, lesdits moyens de fen§trage utilisent une fenetre definie par : 

30 F(n) = V2-sin(7r(n+0,5)/N) n = 0 N-1 

ou N est le nombre d'echantillons de ladite fenetre. 

D'autres caracteristiques et avantages de I'invention apparaitront a la lecture suivante d'un mode de 
realisation preferentiel de Tinvention, donne a titre illustratif et non limitatif, et des dessins annexes, dans 
lesquels : 

35 - la figure 1 est le synoptique d'un dispositif de codage de signaux audionumeriques comprenant un 
disposltif deallocation de bits selon I'invention ; 

- la figure 2 est le schema fonctionnel du module d'elimination des raies masquees ; 

- la figure 3 represente le schema fonctionnel detailie du module de calcui et de codage de I'information 
auxiliaire ; 

40 - la figure 4 est le schema fonctionnel du module de codage predictif de information auxiliaire ; 

- la' figure 5 est un schema lllustrant le principe d'elimination des raies masquees d'apres Tanalyse de 
2WICKER. 

- la figure 6 presente le schema fonctionnel du module de selection d'un quantificateur parmi plusieurs ; 

- la figure 7 est le schema fonctionnel du disposltif d'allocation de bits a chaque bande. 

45 Le dispositif de la figure 1 permet le codage de donnees audio-numeriques selon le precede de 
I'invention. Le signal d'entree x(n) 10, echantillonne a une frequence superieure ou egale a 32 kHz, est 
applique au module de transformation 11. La frequence d'echantillonnage correspond a celle utilisee pour 
le son haute fidelite. 

Dans un mode de realisation preferentiel du module de transformation 1 1 , on utilise avantageusement la 
50 transformee mise au point par PRINCEN et BRADLEY ("Adaptative Transform Coding incorporating Time 
Domain Aliasing Cancellation" (Codage adaptatif par transformation a annulation dans le domaine temporel 
des phenomenes dus au repliement du spectre) : in Speech Communication ; Decembre 1987), encore 
appelee transformee en cosinus discrete modifiee (TCDM). Cette transformee correspond a une projection 
sur une base en cosinus. Les coefficients de transformee sont definis par : 

55 
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N-1 

y(m,k) = S Xjn(n).h(N-l-n).cos(27r(k+/2)(n+nQ)/N) 



k = 0,...,N-1. 

w avec : 

N : taille du bloc de transformee, 

h(n) : fenetre de ponderation des blocs, 

m : numero du bioc de transformee. 

Son avantage principal est lie au fait qu'elle autorise i'emploi de fenetres de ponderation h{n) 
?5 performantes sur le plan spectral realisant ainsi une excellente separation des canaux de transfornnee. La 

concentration d'energie est alors plus forte qu'avec la transformee de Fourier discrete (TFD) par exemple. 

et les coefficients a coder sent tres proches du spectre veritable. 

Avant d'etre transforme, le bloc d'echantilions temporels est done pondere par une fenetre h(n). On 

utilise une fenetre "adoucie", par exemple une fenetre de forme sinusoTdale. definie par : h(n) = ^/2 sin(-7r- 
20 (n + 0,5)/N), n variant de 0 a N-1, N etant le nombre d'echantilions par blocs temporels. La TCDM utilisee 

fonctionne en parfaite synergie avec ce type de fenetre adoucie. En effet, ce type de fenetre permet 

d'obtenir. apres transformation, N/2 coefficients uniques, les N/2 autres coefficients etant identiques, au 

signe pres. Au contraire, une fenetre rectanguiaire entraTnerait un etalement spectral par rapport au signal 

d'origine. Du fait que sa mise en oeuvre reclame d'autre part un recouvrement interblocs valant 50 % de la 
25 taille des blocs, le nombre de coefficients transformes est identique au nombre d'echantilions d'origine du 

signal source a transmettre a chaque bloc. Ce chevauchement interblocs est necessaire pour assurer ia 

parfaite reconstruction du signal. 

Les coefficients y(k) 12 sortant du module de transformation 11 sont ensuite presentes aux entrees des 

divers modules de codage 13,14.15,16.17. 
30 Un premier bloc 14 realise tout d'abord ('elimination des composantes spectrales inaudibles dans le 

signal transforme 12. 

Cette operation d'elimination se base par exemple sur I'analyse de ZWICKER. comme detaille plus loin. 
Cette analyse permet de distinguer dans un signal audio des raies masquees. correspondant a des 
frequences inaudibles. Les coefficients de transformees correspondant a ces composantes inaudibles ne 
35 sent pas transmis. 

La TCDM etant caracterisee par une bonne separation en frequence, fe nombre de raies eliminees peut 
etre important. II en resulte une reduction significative du nombre de valeurs a transmettre. De plus, ces 
coefficients non transmis etant en general de niveau faible, les quantificateurs utilises pour les coefficients 
transmis peuvent etre optimises en consequence. 
40 Le module d'elimination des raies masquees 14 est plus precisement decrit plus loin, en liaison avec la 
figure 2. 

Les raies spectrales conservees fournies en sortie du module 14 servent d'entree au module 15 de 
calcul et de codage de Tinformation auxiliaire. L'information auxiliaire generee par le module 15 est calculee 
par bandes de frequence de largeurs inegales et peut etre codee par deux modes differents. Si le signal est 
45 stationnaire, le codage a lieu par rapport aux blocs precedents (prise en compte de la correlation inter- 
trames), sinon le bloc courant est un bloc de transition et le codage a lieu sans prise en compte de la 
memoire inter-blocs. 

Ces moyens de codage sont decrits plus precisement par la suite, en liaison avec la figure 3. 

Les sorties du module 14 d'elimination des raies masquees et du module 15 de calcul et de codage de 
50 rinformation auxiliaire alimentent le module 16 deallocation des bits pilotant le quantificateur 17. La sortie du 
bloc 16 d'allocation de. bits fournit une information 18 du nombre de bits R disponible pour Texpression de 
chacun des coefficients y(k) du signal transforme 12. Cette allocation de bits est dynamique : elle varle d'un 
bloc au suivant. De plus, elle est congue pour assurer le masquage du bruit de quantification. 

Le module d'allocation des bits 16 a egalement comme entree les valeurs de la fonction d'etaiement 
55 spectral mesuree par bandes de frequence fournie par un module 13 de calcul et de codage de i'etalement 
spectral, sur les coefficients du signal transforme 12. Ceci permet de caracteriser la nature du spectre, et 
notamment s'il est fortement concentre ou non. 

Le fonctionnement du module d'allocation des bits 16 est developpe plus loin. 



5 




EP 0 423 050 A1 

Enfin. il est precede dans le module 17 a la quantification des coefficients y(k) du signal 12. d'apres 
rinformation 18 du nombre de bits R alloue. De plus, selon une caracteristique Importante de I'invention. 
rinformatfon 19 obtenue en sortie du codeur 15 de IMnformation auxiliaire ainsi que INnformation d'elimina- 
tion des raies masquees issue du nnodule 14 permettent de choisir. pour le bloc courant. un quantificateur 
parmi plusieurs quantificateurs disponibles, comme on le verra ci-apres. 

Le decodage se fait de fagon tout a fait symetrique au codage. 

La figure 2 presente le schenna fonctionnel du module 14 d'elimination des raies masquees. 

La fonction de ce module 14 est de discriminer les raies inaudibles du fait des phenomenes de 
masquage, afin que ne soit transmise que information perceptuellement utile. 

Cette procedure est particulierement avantageuse pour les sons a spectre large, riclies en harmoni- 
ques. Un nombre important de coefficients est alors masque. C'est justement ce type de signal qui reclame 
un debit plus fort, du fait de la quantite dMnformation a transmettre. 

Ce dispositif comprend un module de detection des raies masquees. Cette detection porte sur le 
spectre reel et n'est effectuee qu'au codeur. Elle fait appel aux courbes de masquage frequentiel d^apres 
ranalyse de ZWICKER. Comme iilustre en figure 5, il apparart que pour chaque raie 51 emise. les raies se 
trouvant sous une ligne 52 de - 25 dB par bande critique en amont de la raie et sous une ligne 53 de - 10 
dB par bande critique en aval, sont inaudibles. Ces deux pontes correspondent respectivement aux 
masquages frequentiels anterieur et posterieur. 

Le spectre est partage en 24 bandes critiques 81,62,83 et multiplie par le facteur ao de transmission de 
Toreille pour chacune desdites bandes, 

Le calcul du seuil de masquage est separe en masquage "intra-bande critique" et "inter-bandes 
critiques". 

Le masquage intrabande correspond a I'effet global de masquage de toutes les rales 51 1. 51 2 a 
rinterieur d'une meme bande 83. Le calcul du seuil de masquage intra-bande est realise par sommation de 
la contribution de chaque coefficient y(k) du signal transforme. 

Si Ton considere la bande critique j, delimitee par bb(j). limite inferieure. et bh(j). bome superieure, la 
contribution du coefficient y(k) au seuil de masquage intrabande Sin(i) est donnee par ■ 
Sin'(i) - e.(y(k)2.ao(i)) 
avec bfaO)^i^k-3 et k + S^i^bhO) 

ou 0 est un decalage constant correspondant a - 30 dB. 

Ainsi que I'on peut le constater, chaque coefficient y(k) n'affecte pas le seuil de masquage des 4 
coefficients les plus proches. Cette precaution est necessaire pour eviter des mises a zero intempestives 
pouvant se produire autour des pics du spectre. 

Le seuil de masquage intra-bande est finalement obtenu par sommation des Si„'^(i) : 



SinO)= S Si/(i) 



avec bb(j)^i^bhO) et j = 1 .....24. 

Le masquage interbande resulte de la prise en compte. dans chaque bande 82. de I'effet de masquage 
des bandes adjacentes. En fait, seul le masquage posterieur (celui des raies 51 3 de la bande 83) est 
considere pour le calcul du seuil de masquage inter-bandes. Le masquage anterieur (bande Bi) est trop 
faible pour modifier sensiblement le nombre de raies masquees par bloc (-25 dB par bande critique au lieu 
de-IOdB). 

La contribution SouJ(i) de chaque bande critique j au masquage des bandes suivantes (i>i) est calculi 
par : 
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Sout^(0= ©•( S 



y(k)^.aoa))-(l/10) 



k 



bbO) 



i = j + 1,...,24 



Le masquage inter-bandes total, pour la bande critique I, vaut : 



i-1 



Z 




j = l 



Finalement. pour le coefficient y(i), de la bande critique j. ie seuil de nnasquage final est obtenu par 
sommation : 

s(i) = Sin(i) + SoutG) 

L'energie du coefficient y(i). multiplie par le facteur de transmission ao(j), est alors comparee au seuil 
de masquage ainsi defini. Si aoG) y^ (')>s(i), le coefficient y(i) est suppose masque. 

Cette fonction est realisee par le sous-module 21 de la figure 2. Cette figure detaille les sous-modules 
principaux constitutifs du module 14 d'elimination des raies masquees de la figure 1. 

Avantageusement, la detection des raies masquees dans le sous-module 14 est suivie d*un codage des 
indices des raies masquees. realise par le bloc 20. Ce codage, necessaire pour indiquer au decodeur les 
numeros des coefficients masques, fait par exemple appel a la technique de codage des longueurs de suite 
("Run Lengtfi Coding"). 

Soit lm(k). un bit valant 1 si le coefficient y(k) est masque. La serie des {lm(k),k = 0 N/2) presente des 

suites ininterrompues de 0 et de 1, plus ou moins longues formees dans un sous-module 22. C'est ia 
longueur des suites qui est transmise a I'aide d'un code a longueur variable 23. St de nombreuses raies de 
meme etat se suivent sans discontinuite. alors le debit a allouer a cette information auxiliaire peut etre 
faible. 

Le codage a longueur variable du sous-module 23 est assure avantageusement par un code de 
Huffman calcule a partir d*une densite de probabilite experimentale. 

Le codage des suites ne debute qu'a partir de la premiere rale masquee. Le numero de celle-ci est 
transmis sur 9 bits. 

Au codeur, le "Run Length Coding" conslste simplement a rechercher toutes les suites de 0 et de 1 et 
a ieur associer le mot de code de Huffman correspondant. 

La longueur des suites est limitee a des valeurs maximaies : 64 coefficients pour les suites de 0 et 128 
coefficients pour les suites de 1. Si ces limites sont depassees, une suite de longueur nulle et d'etat 
inverse, est transmise. A cette suite de longueur nulle est associee un mot de code de Huffman, calcule lui 
aussi (fiors ligne) d'apres ['occurence de la suite. 

Au decodeur, apres reception du numero de la premiere rale masquee, il suffit de proceder au 
decodage des codes de Huffman. Les suites de codes de longueurs de 0 et de 1 permet de reconstituer 
exactement la serie {lm(k)}. 

Si les suites de 0 et de 1 sont tres morcelees, le debit d'informations auxiliaires peut etre important 
Pour un faible nombre de raies masquees. le gain de Ieur non-transmission peut-etre nul, voire negatif. II 
convient alors de ne pas proceder a cette non-transmission ou tout au moins de la restreindre a certaines 
zones frequentielles. 

Pour cela. le nombre moyen de bits par coefficients est calcule dans les 2 cas : 

- transmission de tous les coefficients : 
Ri{k) = (Ro - Rifs>/{N/2) 

ou . Ro est le nombre total de bits par bloc, 

. Rjfs est le nombre de bits necessaire a la transmission de Tinformation auxiliaire de description du spectre. 
Rifs est en fait la valeur au bloc precedent. 

- non-transmission des raies masquees par utilisation du codage des longueurs de suite : 
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R2(k) = (Ro-Rffs-Rfm)(N/2-N,^) 

oCi . Rim est le debit auxiliaire pour (e codage des longueurs de suites. 
- Nrm est le nombre de raies masquees. 

La non-transmission des raies masquees est effectuee pour toute la bande consideree, si le sous- 
5 module 24 de calcul du debit et de test etablit que : 
< Nrm.(2(Ro-Rifs)/N) 

Si cette condition n'est pas respectee, ce test est accompli dans 4 sous-bandes de frequence de la 
bande consideree, de largeurs egales. Lors de la recherche des suites de 0 et de 1. les valeurs "locales" 
Rim(i) et N,^(l) (i = 1,....4) sont calcuiees. 
10 Si Rim(l) < Nrm(l).(2(Ro-ifs/N), c'ost-a-dire si le gain en bits est positif pour la sous-bande I de frequence 
consideree, le "Run Length Coding" est applique aux coefficients de cette sous-bande I. 

Sinon tous les coefficients de cette bande sont consideres comme etant non masques et IMndice du 
premier coefficient force a 0 est modifie en consequence. 

Le sous-module 25 de validation du codage pilote le sous-module 23 de codage a longueur variable, en 
15 fonction de la necessite ou non de realiser le codage. 

Le debit auxiliaire moyen est de I'ordre de 0,8 bits par raie masquee. Cette faible valeur prouve Tinteret 
de rutilisation du codage des longueurs de suites. 

La figure 3 represente le schema fonctionnel detaille du module 15 de calcul et de codage de 
I'information auxiliaire. 

20 La transmission d'une information auxiliaire est necessaire au calcul de rallocatipn des bits et a la 
quantification des coefficients. Cette information auxiliaire 19 constitue en fait un descripteur plus ou moins 
precis du spectre du signal. 

Dans ie mode de realisation decrit, le descripteur de spectre est calcule dans un sous-module 31 par 
bandes de frequence de largeurs inegales. Le spectre est partage par exemple en 50 groupes de 

25 frequence. 

Les limites. bsi'd) et bsi^O'). cfe ces bandes respectent celles des bandes critiques. Les bandes les plus 
etroites Q = 1,....14) ont la meme largeur que les bandes critiques correspondantes. Les autres bandes ont 
une largeur croissante qui atteint pour la derniere (j = 50) 562.5 Hz (c'est-a-dire 18 coefficients). 

Le descripteur de spectre utilise a(i) est egal a I'ecart type des raies spectraies non masquees dans 
30 chacune des bandes : 

c^^G) = (i/NsiO)). z y^(k) 




40 avec j = 1 50 

NsiO) est le nombre de coefficients non masques dans la bande j. 

L'originalite du codage de cette information, selon invention, reside dans la prise en compte de la 
correlation existant entre les blocs de transformee successifs au moyen d'un codage predictif. Ainsi, fe 
codeur profite de toutes les correlations du signal (a court terme et a plus long terme). 
45 Le codage de Tinformation auxiliaire est habituellement effectue sans tenir compte des proprietes 
perceptuelles. a la difference de la quantification des coefficients. II convient cependant de reserver le plus 
de bits possible au debit du signal principal 101, et done de reduire le debit de {'information auxiliaire 19. 

Un codage direct des composantes du descripteur de spectre a(m,j) (m numero de bloc) reclame un 
debit eleve. Cependant. les signaux etant en general fortement stationnaires, le descripteur de spectre est 
50 tres correle d'un bloc au suivant. 

Le moyen le plus direct pour profiter de cette stationnarite est d'effectuer un codage predictif 32. Du 
fait de la grande dynamique spectrale, il est preferable d'appliquer la prediction a c(mj) exprime en dB. En 
effet. c'est plutot le rapport a(m,j)/a(m-1.j) qui presente un gain de prediction eleve, que la difference a(m.j)- 
a{m-1,j). 

55 ^ Comme represente en figure 4. ce codage predictif comporte un operateur 41 de conversion sur une 
echelle logarithmique suivi du code MIC Differentiel et d'un dispositif 43 de codage a longueur variable. 

La prediction est realisee par un predicteur 44 d'ordre 1 . Le coefficient de prediction ai peut prendre 
une valeur entre 0.95 et 1. L'entree de ce predicteur 44 est la valeur quantifiee prec^dente log(<y'{m,j)). 
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L'erreur de prediction 
e(mj) = log(o(m,j)) - ai.Iog(a'(m-1,j)) 
avec j = 1 ,50 

est quantifiee par un quantificateur uniforme 45 ayant par exemple 32 niveaux pour une dynamique de (- 
5 2,2]. 

Puisque le signal est stationnaire sur des durees importantes. la densite de probabilite des mots de 
code en sortie du quantificateur 45 est tres concentree. Par consequent, ces mots de code subissent un 
codage a longueur variable 43 (codage de HUFFMAN) qui permet de reduire le debit de transmission des 
descripteurs de spectre a environ 2.5 bits par valeur a (mj). 
10 La valeur log (a'(mj)) est obtenue par la sommation 46 de la valeur fournie par un quantificateur inverse 

47. correspondant a la valeur que Ton obtiendra au decodage, et de la valeur precedente issue du 
predicteur 44. 

Si une bande de frequence est entierement masquee (Nsi(j) = 0), il n*est pas necessaire de transmettre 
un mot de code pour la bande j. En effet, la valeur de a{m]) est dans ce cas connue au decodeur au 
15 moyen de I'lnformation concernant les raies masquees. 

Toutefois. pour eviter qu'une erreur de transmission sur les bits l(m,k) se repercute sur les valeurs a - 
(m,j), une redondance est volontairement introduite dans le codage : si Ng,- = 0, un mot de code specifique 
est transmis, calcule en fonction de ses occurrences, comme les autres modes de code. 

AinsI, lorsque la bande cesse d'etre entierement masquee, la prediction porte sur la derniere valeur non 
20 nulle (y'(m-p,j) transmise. 

Lors des transitions spectrales (non-stationnarites du signal), cette procedure de quantification n'est 
plus valable car elle reclame un debit trop important pour conserver la meme precision de quantification. II 
est alors necessaire de faire appel a un codage sans memoire de a(mj), mis en oeuvre dans le sous- 
module 34. 

25 Ce second codage 34 est simiiaire au precedent. La prediction a lieu frequentiellement au lieu d'etre 
effectuee sur les blocs de transformee successifs. L'erreur de prediction est calculee par : 
e(mj) = log(a(m.j)) - log(a'(m.i-1)) 

e(m,j) est codee par un quantificateur uniforme ayant par exemple une dynamique de 100 dB et 50 
niveaux de quantification. Les mots de code en sortie subissent aussi un codage de HUFFMAN. 
30 La premiere valeur a(m.1) est transmise separement. 

Un module 33 de choix du type de codage selectionne le meilleur codage, d'apres le nombre de bits 
depenses. Si le debit necessaire au codage inter-trames depasse un seuil prealablement fixe, le second 
type de codage 34 est employe. Ce choix est transmis au decodeur a I'aide d'un bit de decision 35. 

II est egalement possible de tenir compte. pour la selection du type de codage, d'un autre critere que 
35 celui de la minimisation du debit On peut par exemple agir de fagon a minimiser I'effet des erreurs de 
transmission. 

Le predicteur 44 de la figure 4 est un predicteur auto-regressif d'ordre 1 (AR(1)) avec un coefficient de 
prediction tres proche de 1. Par consequent, Teffet des erreurs de transmission risque de se propager 
indefiniment Puisque ^information auxiliaire a une importance majeure, entre autres pour rallocation des 
40 bits, il est necessaire de reinitialiser le codage inter-trames. A cet effet, pour tous les blocs de rang multiple 
de 16. le codage sans memoire interblocs, est utilise, meme si le signal est stationnaire. 

Les coefficients y(k) 12 sent codes au moyen de quantificateurs adaptatifs non uniformes. L'adaptation 
est realisee par le descripteur de spectre quantifie a'{mj). ou j est le numero de la bande a laquelle 
appartient y(k). 

45 Chaque valeur a'(m.j) represente un nombre variable, Nsi(j), de coefficients y(k) non nuls, du fait de la 
largeur variable des bandes de frequence et du dispositif de detection des raies masquees. Les performan- 
ces des quantificateurs varient en fonction du nombre de coefficients a quantifier NsiO)- 

Selon rinvention. et de fagon a optimiser le systeme de codage, plusieurs jeux de quantificateurs sont 
disponibles, en fonction de NsiO). La figure 6 presente le schema fonctionnel du module de selection du 
50 quantificateur a utiliser. 

Par exemple, dans la configuration suivante, 5 jeux 61 1 a 6I5 de quantificateurs sont disponibles. Un 
module 62 de test sur la valeur Nsi{j) pilote un selecteur 63, selon les crit§res suivants : 

- le premier pour les bandes ayant 1 coefficient non nul : NgjO) = 1 ; 

- le second jeu pour : Nsi{i) = 2 ; 

55 - le troisieme jeu pour : 6 > H^ij) > 2 ; 

- le quatrieme jeu pour : 10 > NsiO) > 5 ; 

- le cinquieme Jeu pour : Nsj(j) > 9- 

Dans chaque cas, des quantificateurs optimaux pour un nombre de bits variant par exemple entre 1 et 
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6 bits, ont ete calcules. Un second selecteur 64 permet de choisir. dans chaque jeu de quantificateurs 65i 
a 656, le quantificateur optimal, en fonction du nombre de bits R 18. AInsi, I'optimisation du choix du 
quantificateur est realisee en fonction du nonnbre de coefficients a quantifier et du nombre de bits alloues 
par le module deallocation de bits. 
5 La figure 7 presente le dispositif deallocation des bits a chaque bande selon ^invention. 

L'allocation des bits est congue pour accompllr la mise en forme spectrale du bruit de quantification 
d'apres des criteres perceptuels. Elle minimise !e rapport bruit/seuil de masquage. Cette procedure est 
effectuee au codeur et au decodeur et est basee sur le descripteur de spectre prealablement transmis. 

Uallocation des bits comporte un module 71 de calcul du seuil de masquage S(k) - calcul similaire a 
70 celui effectue pour la detection des rales masquees - et un module 72 de quantification du rapport a(k).j3(k)- 
.a^ (k)/S(k) comparable a celui decrit par Yannick MAHIEUX dans Tarticle "Transform Coding of Audio 
Signals Using Correlation between successive Transform Blocks" (Codage par transformation de signaux 
audio utillsant la correlation entre les blocs transformes successifs) (Actes du congres ICASSP, 1989, 
Glasgow). 

15 (k) est le carre du descripteur de spectre, etendu a tous les coefficients y(k) de la bande. II s'agit de 

{'element essentiel du rapport a quantifier. Puisque les coefficients sont codes avec des jeux de quantifica- 
teurs differents (selon Nsi(j)). est necessaire dMnclure les performances relatives de chaque jeu de 
quantificateurs dans rallocation des bits, d'apres I'ouvrage de JAYANT et NOLL : "Digital Coding of 
Waveforms" (Codage numerique de formes d'onde) (1984 ; Prentice Hall Signal Processing Series). 

20 La fonction a(k) est egale au facteur de performance du quantificateur a utillser pour le coefficient y(k). 
Une table 73 comporte par exemple 5 valeurs de a(k) calculees prealablement. Cette table est adressee par 
le nombre de coefficients non nuls. La prise en compte des performances reelles des jeux de quantifica- 
teurs permet une amelioration tres sensible de la qualite du codage. 

Le module 74 de calcul de la fonction 0{k) tient compte quant a elle de la fonction d'etalement spectral 

25 a, egalement d'apres JAYANT et NOLL. Cette fonction indique si le spectre est concentre ou non et est 
calculee au codeur par: 

N-1 N-1 
V - (1/N). S lO.Iog,Q(y^ (k)) - iaiog,^((l/N) S (k)) 
k = 0 k = 0 



30 



35 



40 



45 



50 



55 



Pour rallocation des bits, -y est calcule dans 4 bandes de frequence de largeur egaies. Ces 4 valeurs 
sont transmises au decodeur a Taide d*une quantification unlforme sur 6 bits. 

Dans chacune de ces 4 bandes de frequence, la fonction j5(k) est calculee d'apres la valeur de 7 par 
rintermediaire d'une fonction non lineaire. Le r6le de j3(k) est de forcer rallocation des bits a accorder un 
nombre de bits plus important aus zones du spectre qui contiennent des pics. En effet. les coefficients y(k) 
correspondant aux sons purs contenus dans le signal doivent etre codes avec une meilleure precision, le 
seuil de masquage ayant alors un niveau par rapport a celui du signal, plus falble que dans le cas d*un 
spectre de bruit. 

La detection explicite des composantes spectrales Inaudibles, ainsi que rutilisatlon de la correlation 
interblocs. permettent de reduire le debit d'un signal haute qualite, de frequence d'echantilionnage d'origine 
superieure a 32 kHz, a une valeur volsine de 64 kbits/s tout en conservant, d'un point de vue resultat 
auditif. la qualite du signal de depart. 



Revendications 

1. Dispositif d'allocation de bits, du type assurant le pilotage de moyens (17 : 6I1 a 61g) de quantification 
de compression d'un signal (12) audionumerique transforme, destine a etre transmis a travers un canal a 
debit iimite ou stocke sur un support d'Informations numeriques. dans lequel ^allocation (16 ; 72) consiste 
notamment a affecter a chaque bande d'un jeu de bandes adjacentes couvrant la totallte du spectre du 
signal transforme. un nombre (18) de bits specif ique pour Texpression des coefficients transformes dudit 
signal (12). en fonction d'une information auxlliaire (19) correspondant a une description du spectre dudit 
signal transforme, 

dispositif caracterlse en ce qu'il est Informe par des moyens (14; 20.21) d'ellmination prealable de 
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composantes spectraies dudit signal transforme en fonction d*un critere psycho-auditif. 
2. Dispositif selon la revendication 1, caracterise en ce que (de fagon connue) il connporte des moyens (21) 
de calcul du seui! de masquage de composantes spectraies sur critere psycho-auditif» pour Toptinnisation 
de rallocation (16 ; 72) des bits dans chacune desdites bandes. 
5 3. Dispositif selon Tune quelconque des revendications 1 et 2, caracterise en ce que ledit critere psycho- 
auditif fonctionne selon ie critere de masquage psycfio-auditif de ZWICKER. 

4. Dispositif selon I'une quelconque des revendications 1 a 3, caracterise en ce que lesdits moyens (17; 
61 1 a 61$) de quantification comportent au moins deux quantificateurs (61 1 a Bis) distincts et des moyens 
(63) d'affectation selective de Tun desdits quantificateurs a chacune desdites bandes du spectre dudit 

10 signal transforme en fonction du nombre de composantes conservees dans ladite bande, apres ladite 
elimination des coefficients masques. 

5. Dispositif selon I'une quelconque des revendications 1 a 4 caracterise en ce qu'il comprend des moyens 
(72) de minimisation d'un rapport bruit de quantification/seuti de masquage dans chacune desdites bandes. 

6. Dispositif selon la revendication 5 caracterise en ce que ledit bruit de quantification est determine en 
75 fonction d*au moins une des trois informations appartenant au groupe comprenant : 

- I'ecart-type desdites composantes spectraies non eliminees dans ladite bande : 

- un facteur de performance dudit quantificateur selectionne pour ladite bande ; 

- une information d'etalement spectral de ladite bande. 

7. Dispositif selon I'une quelconque des revendications 1 a 6, caracterise en ce que ladite information 
20 fournie par lesdits moyens (14,21) d'eiimination prealable de composantes spectraies est elaboree par des 

moyens (22,23) de codage des longueurs de suites pour Ie codage des indices desdites composantes 
spectraies masquees. 

8. Dispositif selon la revendication 7, caracterise en ce que lesdits moyens (23) de codage des longueurs 
de suites utilisent un code a longueur variable du type des codes de HUFFMAN. 

25 9. Dispositif selon Tune quelconque des revendications 7 et 8. caracterise en ce que lesdits moyens (23) de 
codage des longueurs de suites delivrent un mot de code specifique pour Ie codage des bandes de 
frequence dont toutes lesdites composantes sont eliminees. 

10. Dispositif selon I'une quelconque des revendications 7 a 9, caracterise en ce que lesdits moyens (23) 
de codage des longueurs de suites sent activees par des moyens (25) de selection, en fonction d'une 

30 information de gain de debit apporte par ledit codage. 

11. Dispositif selon I'une quelconque des revendications 1 a 10, caracterise en ce qu'ii coopere avec des 
moyens (15 ; 32,34) de codage desdites informations auxiliaires correspondant a la description du spectre. 

12. Dispositif selon la revendication 11, caracterise en ce que lesdits moyens (15) de codage comprennent 
des moyens (32) de codage predictif. 

35 13. Dispositif selon la revendication 12, caracterise en ce que lesdits moyens (32) de codage predictif 
comprennent des moyens appartenant au groupe comprenant les moyens (41) de conversion logarithmique, 
les moyens (44) de codage MIC differentiel, et les moyens (43) de codage par code a longueur variable, du 
type des codes de HUFFMAN. 

14. Dispositif selon Tune quelconque des revendications 12 et 13. caracterise en ce que lesdits moyens 
40 (15) de codage comprennent egalement des moyens (34) de codage sans memoire interblocs. lesdits 

moyens (32) de codage predictif et lesdits moyens (34) de codage sans memoire etant selectionnes selon 
un critere predetermine. 

15. Dispositif selon la revendication 14 caracterise en ce que ledit critere predetermine est un critere de 
moindre debit et/ou un critere de minimisation de Teffet des erreurs de transmission. 

45 16. Dispositif selon Tune quelconque des revendications 1 a 15 caracterise en ce.qu'au moins une des 
informations appartenant au groupe comprenant ladite information auxiliaire (19) correspondant a la 
description du spectre, ladite information fournie par lesdits moyens d'elimination des composantes 
inaudibles et One information d'etalement spectral, est transmise ou stockee conjointement a chacun des 
blocs d'information principale. 

50 17. Dispositif selon I'une quelconque des revendications 1 a 16, caracterise en ce que ledit signal 
numerique transforme (12) est elabore par des moyens (11) de codage par transformation utilisant une 
transformee du type de la transformee en cosinus discrete modifiee de PRINCEN et BRADLEY. 

18. Dispositif selon la revendication 17. caracterise en ce que lesdits moyens (11) de codage par 
transformation comportent des moyens' de fenetrage adouci du signal temporel faisant apparaTlre une 

55 symetrie dans ledit signal transforme. 

19. Dispositif selon la revendication 18. caracterise en ce que lesdits moyens de fenetrage utilisent une 
fen§tre definie par : 

F(n) = V2.sin(7r(n+0,5)/N) n =• 0 .N-1 
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ou N est le nombre d'echantillons de ladite fenetre, 
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